
REPUBL1QUE FRANQAISE 




KTIFR2004/050 374 



INSTITUT 
NATIONAL DE 
LA PROPRIETE 
INDUSTRIELLE 



REC'D 1 6 N) 


OV 2004 


WIPO 


PCT 



BR E VET D'INVEN T I O N 



CERTIFICAT D'UTILIT£ - CERTIFICAT D'ADDITION 



COPIE OFFICIELLE 

Le Directeur general de I'lnstitut national de la propriete 
industrielle certifie que le document ci-annexe est la copie 
certifiee conforme d'une demande de-titre.de propriete 
industrielle deposee a I'lnstitut. 



a. 

o 
a 

o 

o 



Fait a Paris, le 



0 7 SEP. 2004 



DOCUMENT DE PRIORITE 

PRESENTE OU TRANSMIS 
CONFORMEMENT A LA 
REGLE17.1.a)OUb) . 



Pour le Directeur general de I'lnstitut 
national de la propriete industrielle 
Le Chef du Departement des brevets 




Martine PLANCH E 




net Miuni 




IN>I 



■ iHSirruT 

MAttOHALDC 
1APROPR1CTC 
IHOUSTRIILLe 



26 bis, rue de Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 TeJecopie : 33 (1) 42 94 86 54 



BREVET D'INVENTBON 
CERTIFICAT D'UTILITE 

Code de la proprieie intellectuelle - Uvre VI 

REQUETE EN DELIVRANCE 
page 1/2 



N» 11354*03 




DB 540 e W / 2I0S02 



REMISE DES PIECES 

date 7 AOUT 2003 
UEU 75.INPI PARIS 

N° D'ENREGISTREMENT 0309 7 1 5 
NATIONAL ATTRIBUE PAR CINPI 

DATE OE DEPOT ATTRIBUEE ft J flftljT 2Q03 * 


O NOW! ET ADRESSE DU DEMANDEUR OU DU MANDATAIRE 
A QUI LA CO RRESPONDANCE DOIT ETRE ADRESSEE 

" Philippe BENEZETH 
THOMSON ! 
46 quai Alphonse Le Gallo 
92648 BOULOGNE CEDEX 

« a 


Vos references pour ce dossier 

(factiltatif) PF030127 


Confirmation d'un depot par telecopie 


□ N° attribue par I'INPI a la telecopie 






Demande de brevet 




Demande de certificat d'utilite 


□ 


Demande divisionnaire 

Demande de brevet initiate 
ou demande de certificat d , tdiliie' initiate 


□ 

n° nat* I i I i I i i i I 

N° Hate I I I I ) 1 1 | | 


. Transformation d f une demande de 
brevet europeen Demande de brevet initiate 


N° Date 1 I 1 i 1 i l i | 



TITRE DE L f INVENTION (200 caracteres ou espaces maximum) u : G : ; H 

Procede de selection de documents audio a I'aide d'une interface sonore, et appareil pour la navigation dans un 
espace ; 



□ DECLARATION DE PRIORITE 
OU REQUETE DU BENEFICE DE 
LA DATE DE DEPOT D'UNE 
DEMANDE ANTERIEURE FRANQAISE 


Pays ou organisation 

Date 1 i 1 i 1 i i i 1 N° 1 
Pays ou organisation 

Date 1 i 1 i 1 i i i 1 N° 
Pays ou organisation 

Date 1 i 1 i 1 i i i 1 N° 

□ S'il y a d'autres priariSes, cochez la case et utilises Pimprlmcl ccSufteu 






Norn 

ou denomination sociale 


THOMSON LICENSING SA 


Prenoms 




Forme juridique 


SA 


N° SIREN 


13,8,3,4,6,1,1,9,11 


Code APE-NAF 


|3,2,2,A| 


Domicile 
ou 

siege 


Rue 


46 quai Alphonse Le Gallo 


Code postal et ville 


19 ,2 ,1 ,0 ,01 BOULOGNE-BILLANCOURT 


Pays 


FINANCE 


Nationalite 


Franchise 


1 N° de telephone ffacuttatif) 


01 41 86 52 79 N° de telecopie (facuitatif) 01 41 86 56 33 


Adresse electronique (facultatif) 


philippe.benezeth@thomson.net 




□ S'il y a plus d'un demandeur, cochez la case et utilisez I'imprime «Suite» 



Rempiir imperativement la yuaagg 



IN 3 ! 



NATIONAL OB 
LA PROPRICTC 



BREVET D'INVENTION 
CERTIFICAT D'UTILITE 

REQUETE EN DELIVRANCE 

page 2/2 




m 



REMISE DES PIECES 

date 7AOUT2003 

UEU 



7§ INPI PARIS 



N* D'ENREGISTREMENT 
NATIONAL ATTRIBUE PAR L'lNPI 



0309715 



DB 540 W/ 210502 





BENEZETH ^ — ^^S9BKi^ 


Nom 




Prenom 


Philippe 


Cabinet ou SociSte 


THOMSON 


N °de pouvoir permanent et/ou 
de lien contractuel 


PG11311 


Adresse 


Rue 


46 quai Alphonse Le Gallo 


Code postal et ville 


19 ,2 16 i4 i8 I BOULOGNE CEDEX 


Pays 


FRANCE 


| N° de telephone (/actd/a/0 


01 41 86 52 79 


N° de tetecopie (facultattf) 


01 41 86 56 33 


Adresse electronique (/acrdtatij) 


philfppe.benezeth@thomson.net 


Les demandeurs et'les inventeurs " 
sont les mdmes persbnnes 


□ Oui h: ■<;•'• 
LID Non : Dans ce cas remplir le formulaire de Designation d'inventeur(s) 






Etablissement immediat 
ou etablissement differs 




Paiement echelonne de la redevance 

(endetexversemenfs) 


Uniquement pour les personnes physiques effectual* eiles-memes leur propre depot 

□ Oui 

□ Non 


11 REDUCTION DU TAUX 
DES REDEVANCES 


Uniquement pour les personnes physiques 

□ Requise pour la premiere fois pour cette invention GotndremavisdenofrimpositionJ 

□ Obtenue anterieurement a ce depot pour cette invention <#?/>*sfa? une cqpfe de la 
dtcfstond'admissiond /'assistance gratrnteouinJiquersartfe'renceJ: \ , , , , | 


|0 SEQUENCES DE NUCLEOTIDES 
ET/OU D'ACIDES AMINES 


C] Cochez la case si la description contient une liste de sequences 


Le support electronique de donnees est Joint 

La declaration de conformite de la Hste de 
sequences sur support papier avec le 
support electronique de donnees est jointe 




Si vous avez utilise l'imprim£ aSuite» y 
indiquez le nombre de pages jointes 





OU DU MANDATAIRE 

(Nom et qualfte du sign at aire) 

Philippe BENEZETI 

Mandataire 




VISA DE LA PREFECTURE 
OU DE L'lNPI 

Mme blancaneaux 



La loi n°78-17 du 6 janvier 1978 relative a I'informatique, aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de 1'INPI. 



L'invention concerne un procede de selection de documents audio a 
partir d'une interface sonore, et un recepteur audiovisuel muni d'une interface 
utilisateur permettant de selectionner et reproduire les documents. L'invention 
concerne notamment le fait que I'utilisateur ne pergoit que des signaux sonores 

5 pour Taider dans la selection du document. 

Le stockage d'un grand nombre de documents sonores au sein d'un 
equipement grand public est connu. On peut citer des appareils de lecture de 
compact disque audio (CD) capables de contenir un certain nombre de CD, une 
tetecdmmande permettant a I'utilisateur de choisir d'une part le bon CD, et 

10 d'autre part le bon morceau dans ce CD. Ces appareils possedent un ecran ou 
dispositif d'affichage permettant a I'utilisateur de selectionner le bon CD et le 
bon morceau & Taide d'un numero. Certains de ces appareils possedent une 
fonction de programmation permettant de definir un enchaTnement des 
morceaux sonores, en programmant le numero du CD et le numero du 

15 morceau. 

D'autres moyens de stockage de contenus sonores existent Par 
exemple, des lecteurs portables (ou baladeurs) disposent d'une memoire 
electronique de grande capacite permettant d'enregistrer des centaines tie 
morceaux musicaux. Parmi ceux-ci, on peut citer le lecteur MP3 LYRA produit 

20 et fabrique par la demanderesse. Ce lecteur dispose d'un petit ecran LCD 
permettant d'afficher les fonctions selectionnees sous la forme d'icones, et fes 
numeros des morceaux audio. Des equipements de salon disposent d'un 
disque dur de grande capacite, 20 Gigaoctets par exemple, ce qui permet de 
stacker des milliers de contenus sonores. L'interface graphique est constitute 

25 d'un grand ecran permettant d'afficher plus d'informations, le titre complet du 
morceau par exemple. 

Selon le type d'interface, la selection des documents sonores s'effectue 
par un numero ou par un identifiant au sein d'une liste affichte sur un ecran. 
Des informations sous forme numerique sont associees aux documents 

30 sonores, de sorte que I'appareil de reproduction les affiche permettant ainsi une 
identification precise du document Les donnees numeriques d'identification des 
documents audio sont par exemple le titre, le producteur, le chanteur, la maison 
d'edition... D'autres elements appeles «attributs» permettent de classer un 
contenu par exemple le genre flazz, vocal, rock, musique douce, musique 

35 d'ambiance, etc.). Par contre, certains contenus audio accessibles a un 
utilisateur ne possedent pas automatiquement ces attributs, par exemple 
lorsque I'utilisateur enregistre lui-meme ses morceaux musicaux en direct. Une 
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autre fagon de presenter des contenus audio est d'analyser directement les 
signaux sonores puis de les classer par groupes. II existe des techniques 
d'analyse du signal qui permettent de calculer pour chaque contenu audio des 
valeurs de parametres dits «de bas niveaux». Ces parametres sont par 
5 exemple: le tempo, Penergie, la brillance, I'enveloppe, ... lis sont determines par 
analyse du signal soit sous sa forme numerique, soit sous sa forme analogique. 
Une technique d'indexation de contenu audio est expliquee dans Particle 
« Speech and Language Technologies for audio indexing and retrieval » publie 
en aout 2000 dans la revue IEEE page 1338 a 1353 du volume 88. L'article 
10 explique comment par analyse du signal audio, on peut classifier les differents 
contenus. D'autres articles decrivent des moyens de calcul de parametres de 
bas niveau et des utilisations possibles, voici d'autres articles inclus par 
reference a la presente demande de brevet : 

■ B. Feiten and S. Gunzel, Automatic indexing of a Sound 
15 Database using self-organizing neural networks, Computer 

Music Journal, 18 (3°, 1994 

■ Eric Scheirer, Music Listening systems, PhD thesis, MIT Media 
Laboratory, Apr 2000. 

Une fois que les parametres de bas niveaux ont ete determines pour 

20 chaque document sonore de^ la collection, I'appareil de stockage ou de 
reproduction peut les classer par groupes en fonction de ces parametres. Ainsi, 
les contenus de musique classique peuvent constituer un groupe, de meme les 
morceaux de jazz, un autre groupe. La demande de brevet PCT/GB0 1/00681 
publiee le 23 aoQt 2001 decrit une interface utilisateur constitute d'un 

25 graphisme affiche sur un ecran et controle par un recepteur audiovisuel. Le 
menu affiche presente des icones (« Classical », « Jazz », « Chart 
Music »,« Talk back », ...) selectionnables par I'utilisateur, la selection d'un 
document du groupe activant la reproduction de son contenu sonore. 

Dans tous les cas, Tinterface avec Putilisateur est constitute d'un 

30 dispositif dedication visuel et de moyens d'introduction de commande tels que 
des touches. Le dispositif dedication visuel est coflteux a implemented fragile 
et consommateur d'energie. Un des objets de la presente invention vise a le 
supprimer en offrant a I'utilisateur une autre maniere de selectionner un 
document sonore en vue de sa reproduction, et ceci de fagon performante et 

35 conviviale. 
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L'invention a pour objet un procede de selection de documents audio 
caracterise en ce qu'il comporte : 

- une etape de positionnement d'une pluralite de documents audio dans 
un espace, le positionnement d'un document audio etant fonction d'au moins 

5 une caracteristique du document, 

- une etape de reproduction sonore d'au moins un document 
selectionne par rapport a une position dans ledit espace et en fonction d'une 
commande de Putiiisateur. 

De cette maniere, Putiiisateur pergoit de fagon auditive la position de 

10 certains documents audio places au sein d'un espace. En fonction de cette 
perception auditive par rapport a sa propre position dans I'espace sonore, il 
peut se situer dans Pespace et se deplacer au sein de cet espace. 

Selon un premier perfectionnement, les documents reproduits ont une 
position situee a une distance inferieure a une distance d6terminee par rapport 

15 a une position de Putiiisateur dans Pespace. De cette fagon, seuls les 
documents proches de I'utilisateur dans I'espace sont reproduits. 

Selon un autre perfectionnement, Pamplitude des signaux de chaque 
document reproduit depend de la distance entre sa position dans I'espace et la 
position de I'utilisateur. De cette fagon,. Putiiisateur peut se rendre compte par 

20 Pamplitude du niveau sonore si le document est proche ou non de sa position 
actuelle dans Pespace. Selon un autre perfectionnement, Pamplitude des- 
signaux reproduisant chaque document depend de la valeur d'un angle entre la 
direction de deplacement de I'utilisateur dans Pespace et la position du 
document. De cette fagon, I'utilisateur peut se rendre compte de la position 

25 relative de chaque document dans Pespace. 

Selon un autre perfectionnement, !e nombre de documents reproduits 
est predetermine. Ainsi, Putiiisateur peut percevoir un nombre limite de 
documents sonores sans que ce soit une cacophonie d'ou il ne pourrait extraire 
aucun repere auditif. Selon un autre perfectionnement, le procede comporte 

30 une etape de partitionnement des documents en groupe de documents 
possedant une meme caracteristique, la navigation s'effectuant alors de groupe 
en groupe. Pour cela, un ou plusieurs representants de groupes sont definis et 
reproduits pour aider Putiiisateur dans sa navigation auditive. 
Avantageusement, seuls les groupes dont les representants sont proches de la 

35 position de Putiiisateur dans Pespace sont reproduits. 

Selon un autre perfectionnement du precedent perfectionnement, les 
groupes sont determines en fonction d'un parametre de vitesse de navigation. 
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De sorte que, si I'utilisateur navigue vite dans Tespace, il ne pergoit que des 
groupes de grandes tailles, mais si sa vitesse de navigation baisse, le procede 
lui permet de percevoir des groupes de petites tailles dont les points de ces 
representants sont proches de la position de I'utilisateur. 

5 Selon un autre perfectionnement, le procede comporte une etape de 

reproduction d'un seul document faisant partie de ceux reproduits, ce document 
est reproduit consecutivement a la reception d'une commande. Selon une 
variante, I'etape de reproduction d'un seul document intervient lorsque la 
position d'un des documents reproduits se situe 3 une distance inferieure a une 

10 distance determinee par rapport a une position de I'utilisateur dans I'espace. 

Selon un autre perfectionnement, la caracteristique propre a chaque 
document est un ou plusieurs parametres audio obtenu par analyse des 
signaux sonores des documents. Selon un autre perfectionnement, le nombre 
de dimensions de I'espace est defini par les parametres audio. De cette 

15 maniere, c'est la nature des documents sonores de I'ensemble qui definit les 
parametres de I'espace dans lequel 6volue Putilisateur. 

L'invention a egalement pour objet un Appareil de reproduction de 
documents audio comprenant un moyehrd'introduction de commande et des 
moyens d'emission de signaux sonores ; caracteris§ en ce qu'il comporte en 

20 outre ' - 

- un moyen de calcul de donnees (xi, yi) de positionnement associe a 
chaque document dans un espace, les donnees etant determinees par au 
moins une caracteristique propre au document, 

- un moyen de selection d'au moins un document s§lectionn6 par 
25 rapport & une position dans ledit espace et en fonction d'une commande de 

Tutilisateur, les documents selectionnes etant reproduits. 

D'autres caracteristiques et avantages de Tinvention apparaTtront 
maintenant avec plus de details dans le cadre de la description qui suit 
30 d'exemples de realisation donnes a titre illustratif en se referant aux figures 
annexees qui repr6sentent : 

- la figure 1 est un diagramme bloc d'un lecteur audio selon un exemple 
de realisation de Tinvention, 

- la figure 2 est un tableau associant pour chaque document de la 
35 collection ses valeurs de parametres de bas niveau, 

- la figure 3 decrit une representation de Tespace sonore dans lequel 
evolue i'utilisateur selon un exemple de realisation de ('invention, 
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- la figure 4 decrit un diagramme bloc de I'interface audio selon un 
exemple de realisation de I'invention. 

A I'aide de la figure 1, on decrit tout d'abord le fonctionnement d'un 

5 lecteur reproducteur de documents audio 1 selon un exemple prefere de 
realisation de Invention. Ce lecteur est portable et autonome, il dispose d'une 
batterie 2, une Unite Centrale 3 (UC) reltee a une memoire de programme 12, 
d'un clavier 8 permettant a Tutilisateur d'introduire toutes les commandes 
necessaires a la reproduction des contenus audio, une interface audio 10 

10 comprenant au moins un convertisseur D/A, au moins un preamplificateur dont 
le gain est reglable par I'UC 3 et un amplificateur envoyant les signaux sonores 
amplifies a au moins deux haut-parleurs 11. Le clavier 8 dispose de quatre 
touches de direction et d'un rotacteur permettant d'introduire un mouvement de 
rotation vers la gauche ou vers la droite, des commandes classiques de 

is reproduction d'un document sonore (lecture, avance rapide, retour rapide, arret, 
r6glage du volume), d'un selecteur rotatif et d'au moins une molette. Les haut- 

; parleurs 11 sont connectes au lecteur, ils peuvent etre des ecouteurs sur un„ 
casque porte par Putilisateur. Les contenus -audio sorit avantageusement 
enregistres dans un disque dur 9, mais tout autre support d'enregistrement peut 

20 convenir, en particulier des supports amovibles (CD audio, DVD, cartouche 
magnetique, carte electronique, ...). 

Les contenus audio peuvent etre telecharges dans le disque dur 9 a 
partir d'un reseau de diffusion a travers une antenne de reception 5 associee a 
un demodulateur (Tuner) 4, ce reseau peut etre de type radio ou de television. 

25 Les contenus audio peuvent aussi etre telecharges via une interface reseau 6 a 
partir d'un bus numerique local a haut debit 6 ou tout autre appareil de 
reproduction de contenus audio. Un reseau numerique est par exemple un 
reseau IEEE 1394. Ces peripheriques optionnels sont controles par I'Unite 
Centrale 3 en association avec le programme enregistre dans la memoire 12. 

30 La memoire est selon un mode prefere de realisation une memoire morte de 
type ROM, un autre mode de realisation consiste a utiliser un circuit specialise 
de type ASIC par exemple. 

Le bus num§rique 7 et/ou le reseau de diffusion transmettent au 
recepteur des contenus audio soit sous forme numerique, soit sous forme 

35 analogique, le recepteur les enregistrant dans le disque dur 9. Selon un mode 
pr§f6re de realisation, les contenus audio sont regus sous forme numerique, de 
preference codes selon un standard de compression, MP3 par exemple, et 



6 

stockes sous la meme forme. Selon ce mode prefere de realisation, la capacite 
du disque dur 9 est de 40 Giga-octets par exemple. Le stockage d'une minute 
de contenu audio en MP3 occupant 1 M6ga-octets environ, un tel disque est 
capable d'enregistrer 666 heures de documents sonores. Le telechargement 
5 d'un contenu audio est une technique bien connue qu'il est inutile d'expliciter 
dans le present document 

Une fois un certain nombre de contenus audio memorises dans la 
memoire 9, I'utilisateur veut les selectionner et les reproduire. Pour cela, le 
programme analyse chaque contenu audio et en extrait les parametres de bas 
10 niveau. Comme nous I'avons indique en preambule, il existe de nombreuses 
techniques d'analyse du signal qui permettent d'obtenir pour ces chansons des 
tableaux de descripteurs numeriques. Le nombre des elements d'un descripteur 
varie de 5 au minimum a quelques dizaines. 

Le tableau contenu dans la page d'ecran de la figure 2 presente les 
is valeurs des principaux parametres de bas niveaux constituant les descripteurs 
d'un certain nombre de documents audio. La premidre colonne du tableau 
presente le titre du contenu audio, Pindex dans le tableau serf d'identificateur du 
- • document. Les colonnes suivantes presentent les valeurs de parametres de bas 
\\ niveau associ6s au document, tels que Tintensite sonore moyenne, le tempo, 
; 20 I'energie, le taux de passage par zero (ou « zerocrossing » en Anglais), la 
brillance (ou « brightness » en Anglais), I'enveloppe, I'ecart entre la plus haute 
et la plus basse frequence presente (« bandwidth » en Anglais »), le 

« Loundness », les coefficients cepstraux 

Selon un perfectionnement, les parametres de bas niveaux peuvent 
25 etre foumis sous forme numerique avec le contenu audio. Lorsque le contenu 
est fourni par un moyen de transmission num6rique et sous forme compressee, 
les parametres de bas niveaux associes constituant un champ attache au 
contenu audio. Cette solution est particulierement avantageuse car le calcul des 
parametres est effectue une fois pour toute par le producteur ou le foumisseur 
30 de contenu audio et non par le lecteur. 

Selon le present exemple de realisation de I'invention, les documents 
sonores Di accessibles & partir du lecteur sont virtuellement representes par 
des points Pi disposes dans un espace sonore a n dimensions. Par souci de 
35 simplicity et de comprehension, le present exemple de realisation utilise un 
espace sonore & deux dimensions. Le schema de la figure 3 illustre une telle 
disposition. Les positions des points Pi, definies par leurs coordonn§es (xi, yi) 
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au sein de I'espace sonore, sont calcul6es a partir des paramdtres de bas 
niveau. Selon I'exemple de la figure 3, un point Pi est un identificateur 
representant un document sonore Si. Les coordonnees (xi, yi) sont obtenues 
par projection du point Pi dont les coordonnees sont les -valeurs des 

5 descripteurs de bas niveau sur un echantillon sonore, sur un espace de 
dimension 2, 3, etc., selon le type de representation choisie. La projection 
depuis I'espace des descripteurs vers cet espace a 2 dimensions est 
determinee par une analyse en composantes principales ou ACP. UACP est 
notamment decrit dans le document Saporta 1990, intitule « Probabilites 

10 Analyse de donn6es et statistiques, Edition Technip ». Cet algorithme d'analyse 
de donnees a pour but de determiner un sous-systeme d'axes lie Iin6airement a 
roriginal qui « 6tale » au mieux les documents, ces axes tendent a confondre 
les axes originaux correles.. De cette maniere, le programme peut analyser les 
documents sonores et determine lui-meme des dimensions principales c'est 

15 alors le programme qui choisit le nombre de dimensions de I'espace sonore. 
Selon cette technique, la collection de document peut etre representee par un 
- 1 espace a plus de deux dimensions. On peut ainsi creer un espace sonore a 
s i trois dimensions oD evolue I'utilisateur. Dans ce cas, il faut equiper ^'installation 
de.haut-parleurs 1 1 supplementaires, et les disposer en haut et en bas de fagon 
: 20 a donner a Tutilisateur ('impression que le son vient aussi du haut ou du bas. 
Les descripteurs de bas niveau etant supposes avoir une coherence- 
perceptuelle (les sons sont perceptuellement proches si et seulement si les 
valeurs des descripteurs de bas niveau sont proches), et la projection etant 
continue, les points proches correspondent & des sons perceptuellement 

25 proches. De fagon generate, les coordonnees {Xi, y 2 ,... zi} d'un point Pi dans un 
espace multidimensionnel permettent a I'utilisateur de determiner le type du 
document sonore associe. En effet, les positions des points Pi etant calculees 
en fonction des valeurs de parametres de bas niveau, si deux points sont 
graphiquement eloignes, les valeurs des param§tres de bas niveau des deux 

30 documents sonores identifies par ces deux points sont tres differentes et done, 
le type du contenu sonore est different, par exemple un morceau de musique 
classique et un discours politique. Par contre, si deux points sont proches, les 
types des documents sonores associes le sont aussi sur le plan auditif. 

L'utilisateur selectionne un document au sein de Tespace sonore par la 

35 perception auditive que le lecteur genere. Pour cela, le lecteur positionne 
l'utilisateur au centre de I'espace sonore, en un point Pu de coordonnees (xu, 
yu), et selectionne les documents audio dont les points Pi sont les plus pres de 
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la position (xu 3 yu) en vue de ies reproduire. Par sa perception auditive, 
I'utilisateur apprehende I'espace sonore, et peut se diriger vers un document Di 
a I'aide du son « emis » par le point Pi associe a ce document, en actionnant le 
louche qui donne la direction du haut-parleur 11 reproduisant avec le plus forte 
5 intensite ce document. 

Le schema de la figure 4 illustre Ies details de I'interface audio 10. 
L'interface audio 10 se compose de deux parties identiques, Tune pour la 
reproduction sur i'ecouteur gauche 11 et Tautre pour I'ecouteur droit 11. Le 
nombre de documents selectionn6s par le programme doit etre faible, cinq par 

10 exemple. Pour chaque voie, I'UC 3 associe a son programme enregistre dans la 
m§moire 12 controle cinq s6lecteurs S1, S2, S3, S4 et S5 dont Ies fonctions 
sont de selectionner un document dans I'ensemble des documents audio de la 
memoire 9 et de le reproduire. Les cinq signaux audio selectionnes par Ies 
selecteurs Si sont transmis respectivement a cinq preamplificateur A1 , A2, A3, 

15 A4 et A5 dont les gains sont controles par I'UC 3. Le gain d'un preamplificateur 
Ai reproduisant un document audio Di est proportionnel & la distance dans 
Pespace sonore separant le point (xu, yu) et le point Pi de coordonnees (xi t yi) 
assocte a ce. document Le gain depend aussi de la direction oti se situe le point 
(xi, yi) par rapport 3 une droite partant du point (xu, yu) dans la direction face a 

20 I'utilisateur place dans Pespace sonore. Cette droite est representee par une 
fl&che sur la figure 4. De telle sorte que, tous les documents dont les points Di 
sont situes a gauche de I'utilisateur dans I'espace sonore sont reproduits par la 
voie gauche, et ceux situes a droite sont reproduits par la voie droite. De plus, 
le gain est d'autant plus grand que I'angle entre le segment form6 des points Pi 

25 et Pu, et la droite Du representant la direction face a I'utilisateur. Si le document 
est pile en face de I'utilisateur, le point Pi est done sur cette droite Du alors, 
I'utilisateur entend le contenu audio de ce point aussi bien a gauche qu'a droite. 
Enfin, les cinq signaux emis par Ies preamplificateurs sont melanges dans un 
amplificateur additionneur et amplifie avant d'etre envoyes vers les ecouteurs 

30 ou haut-parleurs 1 1 . 

Ainsi, I'utilisateur entend des contenus audio differents a gauche et a 
droite de ses oreilles. En fonction des signaux sonores, il peut s'orienter vers la 
gauche ou la droite a I'aide des touches de direction placees sur le clavier 8, et 
se diriger vers un point correspondant a un contenu Di qu'il desire ecouter. 

35 Lorsque le point (xu, yu) se situe au meme endroit que le point (xi, yi) 
correspondant au document sonore Di, ou en est proche d'au plus une distance 
determinee, le document est considere comme s6lectionne et reproduit en 
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stereo sur les deux 6couteurs 11, les quatre autres documents ne sont plus 
reproduits. Si I'utilisateur appuie sur les touches de direction et s'eloigne du 
document qu'il vient d'ecouter, le programme reproduit alors les cinq 
documents les plus proches du point (xu, yu) avec les ponderations 

5 correspondantes a la distance et a la direction. 

Une variante consiste a implementer une touche « Selection » sur le 
clavier 8 du lecteur 1. Lorsque I'utilisateur appuie sur cette touche, le 
programme selectionne le document sonore le plus proche du point (xu, yu) ou 
se trouve virtuellement I'utilisateur et commande sa reproduction a Texclusion 

10 de tout autre document La position (xu, yu) est memoris6e de sorte qu'un 
second appui sur la touche « Selection » fait revenir a I'etat precedent ou les 
cinq documents sonores les plus proches de la position du point (xu, yu) sont 
reproduits. 

Nous allons maintenant decrire des perfectionnements qui vont aider 

15 I'utilisateur a naviguer dans Pespace sonore. 

Les cinq documents les plus proches du point associe a I'utilisateur 
sont egalement proches auditivement parlant, de sorte qu'il n'est pas facile pour 
I'utilisateur -de determiner un axe de deplacement en fonction d'un type 
particulier de musique par exemple. Un premier perfectionnement consiste a 

20 determiner des groupes de documents sonores ayant une coherence auditive,, 
et a reproduire un ou plusieurs documents dits « representant(s) » de chaqup 
groupe. La determination des groupes s'effectue en comparant les valeurs 
contenues dans les descripteurs des documents sonores, qu'ils soient 
telecharges ou calculus localement, et en regroupant ceux dont les valeurs sont 

25 proches. 

Selon une premiere approche, le regroupement des contenus en 
groupes (ou « cluster » en Anglais) coherents peut etre realise a Paide d'un 
algorithme dit de « clustering », par exemple I'algorithme des k-means (Mac 
Queen, « Some Methods for classification and analysis of multivariate 

30 observations », Proc Fifth Berkeley Symposium on Math., Stat, and Prob., voM, 
pp 281-296, 1967). Les techniques de calcul de groupe sont bien connues. En 
utilisant I'algorithme des k-means par exemple, on peut facilement controler le 
nombre des groupes ainsi produits. Selon une deuxfeme approche, les groupes 
sont determines par un choix prealable de classes (par exemple : humeur (en 

35 Anglais : mood), instruments dominants, tempo, etc.) et une verite-terrain 
contribuant a d6finir ces classes, lis sont obtenus par application d'un 
algorithme d'apprentissage a cette v6rite-terrain. Le repr^sentant d'un groupe 
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est le document situe le plus proche du centre. Selon une variante, le 
repr^sentant est une succession de documents ou d'extraits des documents du 
groupe, chaque extrait etant reproduit pendant 10 secondes par exemple. 
L'ensemble des extraits constituant le representant du groupe est reproduit en 
5 boucle. Selon une autre variante, le programme produit un son synthetique 
calcule a partir d'une moyenne des parametres de bas niveau caracteristiques 
des documents sonores du groupe. 

Uaffectation d'un document a un groupe determine s'effectue en 
rajoutant une nouvelle colonne au tableau des descripteurs de la figure 2, cette 

10 nouvelle colonne contient le numero identifiant le groupe auquel le document 
appartient Sur la figure 3, on a identifie par des contours 4 groupes. Lorsque 
l'utilisateur veut naviguer sur des groupes, il appuie sur une touche du lecteur, 
appelee « Groupe » et selon Pexemple illustre par cette figure, les quatre 
documents les plus representatifs de chaque groupe sont reproduits (ces quatre 

is documents apparaissent sur la figure 3 par un contour en gras). Ce mode de 
navigation est d£sactive en appuyant une nouvelle fois sur la touche 
« Groupe ». En naviguant d'abord d'un groupe a I'autre, l'utilisateur selectionne 
rapidement le type de contenu audio qu'il souhaite, puis en desactivant le 
mode, il navigue de document proche en document proche au sein de ce 

20 groupe. En actionnant le rotacteur dispose* sur le clavier 8, l'utilisateur reste sur 
le m§me point Pu de I'espace sonore et change la direction indiquee par la 
fleche sur la figure 3. Ainsi, I'utilisateur peut tout en restant sur place chercher 
une direction de deplacement, stopper sa rotation lorsque le type de musique 
qui pergoit en face de lui et se diriger ensuite dans cette direction. 

25 Une variante de la touche « groupe » consiste a considerer la vitesse 

de deplacement comme moyen de selection du mode de navigation et de la 
fagon de calculer les groupes. L'utilisateur se deplace en appuyant sur les 
quatre touches de direction, lorsqu'il appuie longtemps sur une touche ou de 
fagon successive et rapide, le programme considere que l'utilisateur desire 

30 augmenter le vitesse de deplacement. Un unique et court appui sur une touche 
permet de revenir a une vitesse de deplacement normale. Une variante 
consiste a implementer une molette sur le clavier 8 permettant a Tutilisateur de 
determiner finement la vitesse. En cas de deplacement rapide, le programme 
cree peu de groupes de grande taille. Ces groupes contenant de nombreuses 

35 chansons, les representants que l'utilisateur entendra ne donneront forcement 
qu'une idee approximative du contenu des groupes. Si l'utilisateur ralentit sa 
vitesse de deplacement, le programme va creer des groupes plus petits et done 
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permettre a I'utilisateur une selection plus fine. Dans ce cas, il est inutile de 
calculer des groupes pour tout I'ensemble des chansons mais seulement dans 
le voisinage de I'utilisateur. Ces groupes §tant definis plus finement, les 
representants sont plus fideles au contenu des groupes. Lorsque la vitesse est 
5 minimale, seuls les documents les plus proches sont reproduits et ainsi on 
retrouve le mode de navigation de documents proches en documents proches. 

Bien que la pr£sente invention ait ete decrite en reference aux modes 
de realisation particuliers illustres, celle-ci n'est nullement limitee par ces modes 
10 de realisation, mais ne Pest que par les revendications annexees. On notera 
que des changements ou des modifications pourront etre apportes par Thomme 
du m§tier, notamment en ce qui concerne les moyens d'introduction des 
commandes sur le clavier 8. 
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Revendications 

1. Procede de selection de documents audio caracterise en ce qu'il 
compofte : 

5 - une 6tape de positionnement d'une pluralite de documents audio dans 

un espace, le positionnement d'un document audio etant fonction d'au moins 
une caracteristjque du document, 

- une etape de reproduction sonore d'au moins un document 
selectionne par rapport a une position dans ledit espace et en fonction d'une 

10 commande de I'utilisateur. 

2. Procede de selection de documents audio selon la revendication 1 ; 
caracterise en ce que les documents reproduits ont une position situee a une 
distance inferieure a une distance determinee par rapport a une position de 

15 I'utilisateur dans I'espace. 

3. Procede de selection de documents audio selon la revendication 2 
caracterise en ce que I'amplitude des signaux reproduisant chaque document 
depend de la distance entre sa position dans I'espace et la position de 

20 I'utilisateur, dans I'espace. . • * 

4. Procede de selection de documents audio selon la revendication 2 
ou 3 caracterise en ce que I'amplitude des signaux reproduisant chaque 
document depend de la valeur d'un angle entre la direction de deplacement de 

25 Tutilisateur dans I'espace et la position du document. 

5. Procede de selection de documents audio seion Tune quelconque 
des revendications 1 a 4 caracterise en ce que le nombre de documents 
reproduit est predetermine. 

30 

6. Procede de selection de documents audio selon Tune quelconque 
des revendications precedentes caracterise en ce qu'il comporte en outre les 
etapes de : 

- partitionnement des documents en groupe de documents possedant la 
35 meme caracteristique, 

- definition d'au moins un document representant chaque groupe, 
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- reproduction des documents representant une pluralite de groupes, la 
position de ces documents ayant une position situee a une distance inferieure a 
une distance determinee par rapport a la position de I'utilisateur dans Tespace. 

5 7. Proc6de de selection de documents audio selon la revendication 6 

caracterise en ce que les groupes de documents sont determines en fonction 
d'un parametre de Vitesse de navigation. 

8. Precede de selection de documents audio selon Tune quelconque 
10 des revendications precedentes, caracterise en ce que consecutivement a 

Introduction d'une commande par I'utilisateur, Tetape de reproduction ne 
reproduit qu'un seul document parmi ceux reproduits precSdemment. 

9. Proced6 de selection de documents audio selon la revendication 8, 
is caracterise en ce que Tetape de reproduction d'un seul document intervient 

lorsque la position d'un des documents reproduits se situe a une distance 
inferieure a une distance determinee par rapport a. une position de I'utilisateur 
dans Tespace. 

20 10. Procede de selection de documents audio selon lune quelconque 

des revendications precedentes ; caracterise en ce qu'il comporte une etape de 
determination de parametres audio par analyse des signaux sonores des 
documents, la caracteristique etant un ou plusieurs des parametres audio. 

25 11. Proc6de de selection de documents audio selon la revendication 

10, caracterise en ce que le nombre de dimensions de Tespace est defini par 
les parametres audio. 

12. Appareil de reproduction de documents audio comprenant un 
30 moyen d'introduction de commande (8) et des moyens d'emission de signaux 
sonores (10,11); caracterise en ce qu'il comporte en outre 

- un moyen de calcul (3,12) de donnees (xi, yi) de positionnement 
assoctes a chaque document dans un espace, les donnees etant determines 
par au moins une caracteristique propre au document, 

35 - un moyen de selection (3,12) d'au moins un document selectionne par 

rapport a une position dans ledit espace et en fonction d'une commande de 
I'utilisateur, les documents selectionnes etant reproduits. 
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